正規表現入門

2026年2月18日大幅書換

はじめに

「正規表現」で文字列を検索すると検索の幅が広がってすごく便利です。正規表現で文字列を置換処理をすると、今まではひとつひとつ手作業でやっていたことが一瞬で終わってしまうこともあります。ただ正規表現は一般的にはあまりなじみがな無いかもしれませんし、「普通の文字列検索・置換処理だけでも十分」と思われる方も多いかもしれません。

私は自作のテキストエディタを作るにあたって、正規表現検索・置換処理も自作してみました。自作した理由は、自作しないと「正規表現」に関する部分は他のライブラリ頼りになってしまいます。もし頼りにしているライブラリに不具合や、ましてや開発が止まったり終わったりしてしまったりするともう対応できなくなってしまいます。そんな訳で自作したのですが、結果的には自分も正規表現に沢山触れることになりまして、より理解が深まりました。

それとちょっとした心残りも書いておきます。それは「戻り読み」機能と「先読み」機能についてなのですが、これらの機能に「繰り返し」機能を含められればもっと使い勝手が良くなったはずなのですが、残念ながら「再起呼び出し」を出来るような構造にしなかったために実装することができず、断念しました。再起呼び出しが出来るようにしてあれば･･･実装することは可能だったのですが･･･、作り始めた当初はこんな機能があるとは考えていませんでしたので･･･仕方ない･･･と諦めるしかありませんでした。

以下、その正規表現について自作したテキストエディタに実装した範囲内で解説したいと思います。

正規表現一覧

（１）.（ピリオド）
（２）*
（３）+
（４）(pattern)
（５）(?:pattern)
（６）x|y
（７）{min,max}
（８）[xyz]
（９）^, $
（１０）\d
（１１）\s
（１２）(?<=pattern)
（１３）(?<!pattern)
（１４）(?=pattern)
（１５）(?!pattern)
（１６）??, *?, *+, {min,max}?
（１７）\1～\9
（１８）\

※TEditorMXには一部、独自仕様があります（改行コードは常に \r\n など）。詳しくはTEditorMX付属のヘルプをご覧下さい。

（１）.（ピリオド）

.（ピリオド）は改行コード以外の１文字とマッチします。

<< では実際にやって確認しましょう >>

サンプルプログラム（sample1.cpp）をTeditorMXで開いて下画像のようにツールバーの検索文字列に
.（ピリオド）１文字を入力し、正規チェックボックスにチェックを入れ、編集メニューの【キーボード検索→下方向検索】（Ctrl+Down）^※１を実行してみて下さい。

※１: (Ctrl+Down)とはCtrlキーとキャレットキーの下(Down)を同時に押すことです。この場合Ctrlキーとキャレットキーの下(Down)を同時に押すことで下方向に検索処理が実行されます。その都度ポップアップメニューを開いて項目を選択しなくても簡単に検索処理を実行することができます。

実行するたびに1文字毎にマッチ（選択範囲が移動）していきます。ただし、改行コードとはマッチしませんので改行コードの手前まで来たら次の行へ移動します。

もし、「良く分からない」という場合にはポップアップメニューの【置換】(Ctrl+Shift+R)で文字列置換ダイアログを開いて検索文字列に同様の設定をし、置換文字列に適当な文字（ここではイコール = ）を指定し、置換を実行してみて下さい。改行コード以外の文字がすべてイコール（=）に置換されるのが確認できると思います。

置換ダイアログ設定

置換前（test_period.txt）

a
bc
def
あいうえお

置換後

=
==
===
=====

置換文字列（=）の数を数えれば半角文字（アルファベット）と全角文字（ひらがな）に関係なく、各文字一つ一つと .（ピリオド）がマッチしていることが確認できると思います。

正規表現入門

はじめに

（１）.（ピリオド）

（２）*

（３）+

（４）(pattern)

（５）(?:pattern)

（６）x|y

（７）{min,max}

（８）[xyz]

（９）^, $

（１０）\d

（１１）\s

（１２）(?<=pattern)

（１３）(?<!pattern)

（１４）(?=pattern)

（１５）(?!pattern)

（１６）??, *?, +?, {min,max}?

（１７）\1～\9

（１８）\